Cell 50周年特刊评论 | 从来自结构生物学的未来视角看细胞功能的发挥
加星标,再也不怕错过更新!方法见文末动图。
“我们究竟由什么组成?”——作为生物学领域内一个恒久存在的话题,也许有人会说,我们是由细胞组成的。然而,站在更为微观的尺度,一个细胞由数以亿计的分子组成,分子又进一步由更小的粒子组成,这些粒子如何在微观尺度上自主地发挥功能,并与其他粒子相互作用,又如何最终呈现为细胞水平甚至个体水平多种多样地生物学功能,始终是另科学家们困扰又着迷的问题。
结构决定功能,从DNA双螺旋的发现和第一个蛋白结构的确定至今,我们已经能够在原子水平解释许多分子机器发挥功能的机制。在此基础上,如果我们能够知晓细胞内所有结构——功能的对应关系,或许我们就能够知道细胞作为一个整体究竟是如何发挥功能的。然而,即便如此,我们所面临的挑战仍然是巨大的。首先,所有生物大分子都具有内在的动态性,分子所处的环境可以通过热波动向分子传递能量,导致分子发生自发的构象变化,这些不同构象状态下的分子结构共同决定了其功能 (图1)。然而,由于不同构象出现的概率不同,小概率的构象状态可能很难为研究者所捕捉到;此外,即使我们了解复杂系统的基本组成部分,也很难在实际上理解系统的运作方式。像细胞这样的复杂系统中往往会出现新的性质和有效性法则,而这些很难从对基本组成部分的描述中进行预测。因此,我们需要一个新的概念框架、语言和技术工具,来弥合从单个分子到整个细胞的差距。
图1. 真核细胞中的蛋白可受到多个维度的调节
2024年2月1日,Martin Beck、Roberto Covino、Inga Hanelt和Michaela Muller-McNicoll在Cell上共同发表题为Understanding the cell: Future views of structural biology的评论文章,讨论了结构细胞生物学未来的发展前景,总结了目前方法的局限性,并对下一代实验、结构模型和科学概念进行了展望。
结构生物学顶尖技术手段的优势与局限性
目前,通过结构分析,结合先进的生物化学手段,研究者对越来越多分子机器的工作机制进行了阐述。通过利用这些丰富的实验数据对基于AI的预测工具进行训练,我们对生物大分子结构的了解以前所未有的程度被拓宽了,基于AI的分析解释了大量过去未知的蛋白折叠方式,甚至加速了研究者对新型蛋白的从头设计。除此之外,原位结构生物学的研究使得我们能够有机会在细胞内部对分子机器的运作方式进行观察。然而,尽管新的技术一直在产生与发展,我们对细胞内谱图某些领域的认知仍然是一片空白。
细胞内分子的本质是动态的,然而传统的单颗粒冷冻电镜 (cryo-EM) 或X-射线晶体学在捕捉稀有状态和过渡态上困难重重。虽然XFEL、NMR、EPR、单分子FRET、hsAFM等技术手段能够允许研究者对分子的动态性进行研究,但这些技术通常需要大量的生物分子或位点特异性标记,并在一定程度上受到分子大小的限制。因此,尽管在实验上对结构动力学进行表征十分重要,但这目前仍具有十分大的挑战性。
此外,许多分子内无序的区域实际上对细胞功能至关重要,如形成无膜细胞器、改变亚细胞微环境的生物物理特性、扩展蛋白之间的相互作用、对小分子的运动进行限制等。然而,目前这些序列的结构不得而知,导致它们在分子水平上仍然缺乏明确的定义。又或者是对分子功能具有重要影响的转录后修饰 (PTM),与其相关的结构信息常常在算法平均的过程中丢失,这限制了我们对PTM的进一步理解。
在单颗粒冷冻电镜分类的过程中,无法贡献高分辨率信息的颗粒常常会被作为“垃圾类”排除在外,然而这些颗粒很可能代表一些构象可变的状态或在一些中间态之间转变的过程 (图1)。这意味着,通过平均算法获得高分辨率结构可能具有一定的误导性。在评估大的构象变化或理解大型分子机器的整体结构时,10-20 Å的中等分辨率足以;相比之下,理解离子配位机制则需要更高的分辨率,如3 Å以内,可能还需要涵盖分析位点附近水分子的信息。结构的分辨率是否足够应该以是否足以回答生物学问题为依据。
虽然体外重组技术是理解分子活动的重要手段,但一旦原位结构分析在某些实例中得以才成功实现,通常会产生一些具有把挑战性的发现并导致领域内认知的变化。在这些研究中,一个重要的例子是对核孔复合体 (nuclear pore complex, NPC) 的研究,作为一个~120 MDa、由将近30个基因编码的大型分子机器,虽然过去的X-射线晶体学研究已经揭示了其中许多蛋白的折叠方式和亚复合物结构,然而这些单独的组分如何作为一个整体发挥功能始终不得而知,而结合原位结构生物学分析,其全貌终于得以为人所见 (图2)。
图2. NPC的完整结构
了解细胞内部的分子活动
如果我们想要了解细胞如何以一个整体发挥功能,我们就需要革新的技术手段对细胞内的动态活动进行精细地控制,从而对结构的动态性以及局部浓度进行定量。对于任何一类分子,对其在细胞内的含量进行高时空分辨率的确定都是至关重要的。虽然前方困难重重,但是成像手段和组学技术的进步还是让研究者距离最终目标更近了一些。
Cryo-ET
Cryo-ET作为一种强大的工具,可以在细胞内捕获高分辨率的三维结构信息。结合亚断层平均算法,对大型复合物的数据处理已经可以实现进近原子分辨率,在以26S核糖体为代表的数据集中,cryo-ET能够对其与在底物互作过程中的状态分布以及整个肽链延伸周期中的功能状态进行确定。然而,平均算法的使用仍对相应构象状态在整个构象集合中的丰度存在要求,如果要跳出这一限制,我们就需要在平均算法以外开辟新的方法。其中一种方法便是基于模板的匹配,通过模板的特征在断层扫描图像中对分子的构象状态和位置进行系统的评估,然而,目前这一方法仍然受到分子大小和丰度的限制,因而很少被用于除了核糖体或蛋白酶体以外的数据。不过,在最新的研究中,已经用研究团队利用最新一代硬件对模板匹配的数据进行了系统地优化,从而对非常细微地构象变化和小分子量的颗粒进行检测。除此之外,机器学习的方法也可能有助于突破模板匹配方法的这一限制。
目前,Cryo-ET技术仍存在许多局限性:1. 对分子的标记仍然具有挑战性,已有的解决措施并不适用于所有的大小或表达水平的蛋白;2. Cryo-ET一次只能分析细胞的一小部分,限制了分析的范围;3. 由于样品必须被快速冷冻以保持其生物结构,对样品制备的要求因而更加严苛。
基于荧光的超分辨成像
在最新的方法中,基于荧光的超分辨显微技术 (super-resolution microscopy, SRM) 已经能够达到亚纳米精度,虽分辨率仍无法与许多结构生物学手段媲美,但其与cryo-ET相结合后,可以为细胞原位结构生物学的研究提供更为丰富得信息。如MINFLUX (minimal fluorescence photon fluxes) 纳米显微镜,其2-3 nm的空间分辨率已能够真正实现分子级别的荧光成像,对包括NPC和线粒体接触位点在内的一系列亚细胞结构进行精细成像。MINFLUX与STED的结合可以进一步提升空间精度,提供生物大分子在单个氨基酸尺度上的信息。
即便如此,荧光显微镜也面临着诸多技术挑战,如视场有限、成像耗时长、缺乏活细胞中的多重成像等。为解决这些问题,研究者需要寻找更小的荧光物质以及新的标记策略。
亚细胞和空间组学
组学 (omics) 一词指对细胞内特定类别的生物分子,如蛋白质、脂质、mRNA或代谢产物的总和进行研究,这一方法非常适合于在特定细胞状态下识别和量化生物分子及其变化,并对分子过程进行定量描述。然而,由于样品制备过程中对细胞的裂解破坏了细胞环境和空间信息,亚细胞结构的时空动态性通常无法被捕捉。空间组学的诞生试图对这一局限性进行规避,但目前尚无法完全和准确地对细胞组成进行呈现。
基因组范围的空间组学能够在细胞本身所处的环境中对单个细胞中的所有分子进行分析,但通常不提供亚细胞水平的信息;相比之下,有靶向性的空间组学可以非常精细地描绘特定细胞区段、亚细胞结构或细胞器中的分子信息,但却往往只能提供在时间尺度上某一帧的信息。此外,低丰度的蛋白、剪接异构体、裂解产物和翻译后修饰的分析仍具有很大挑战性。对空间组学而言,仍需要进一步发展高分辨率和高灵敏度的质谱技术。
相比于蛋白组和转录组,目前仍缺乏高分辨的技术确定脂质在空间中的分布,虽然成像质谱能够解析脂质在局部的分布,但分辨率远不及亚细胞水平,相应的技术的发展将有助于对亚细胞结构及其功能进行更进一步的分析。
细胞自我组织的特性及其对大分子组装和功能的影响
哪些因素调节细胞环境中大分子组装的功能?这个问题一直是细胞生物学家关注的核心问题,但由于缺乏适当的工具,它在一定程度上被结构生物学家忽视了。本文对一些组织细胞并在环境中调节分子功能和结构的原则进行了阐述。
局部限制作用
在细胞内对生物大分子进行局部限制有助于对细胞整体功能的调节,使得分子可以在正确的时间和地点发生相互作用。细胞内充斥着各种各样的生物分子与竞争作用,随着基因组复杂程度的不断增加,所有的事件都将越来越复杂,对分子进行局部限制并形成特定的分子群体,建立适合大分子正确组装和功能发挥的生物物理环境将有效地降低这种复杂性。虽然细胞器膜可以提供这种局部限制,但我们对膜的自我组织形式也了解甚少,近年来,人们也对无膜细胞器及及凝聚体给予了相当多的关注。
分子标尺
在最简单的定义中,分子标尺定义了两个分子实体之间的距离,它可以通过两个由linker分隔的短线性基序 (short linear motif, SLiM) 或RNA上的两个蛋白结合基序来实现。分子标尺可以帮助进行蛋白复合物的组装,并确保其中的化学计量比;此外,分子标尺还能够组织共翻译过程,从而确定该事件中的确切序列和事件。未来的研究将重点放在生物标尺上将是有益的。
膜的自我组织
膜生物学中存在许多未解之谜,如为何有成千上万种不同的脂质种类,以及脂质组成在时空上受到严格调控是如何发生的。脂质对膜的生物物理特性至关重要,而蛋白质和脂质相互依存。细胞器结构的形成受到蛋白质和脂质的共同调控,而蛋白质的结构分析并不能完全解释细胞器的形成。因此,自我组织这一额外原则在塑造细胞器结构中起着重要作用。
核膜定位的LINC复合物由SUN和KASH组成,可以定义核膜内外的最大距离。同时,细胞器的整体形状需要严格控制,可以通过调节渗透压或细胞器内的生物分子数量来实现。脂质的可用性和渗透压的变化会调节膜张力,这三个参数相互影响,受到调节蛋白的调控。这种系统也能控制蛋白结构,如核孔复合物对渗透压变化的响应。此外,分子拥挤和分子凝聚也可能参与运输囊泡的形成。为了理解这些复杂的结构特征,需要精确的定量和空间数据。通过干扰和合成生物学实验,可以阐明调控细胞器组织的复杂自我组织原则。
细胞结构生物学的未来
下一代结构细胞生物学的共同目标应该是在细胞环境中对复杂的生物学过程进行研究。出了单纯的技术发展外,还应当开发和采用捕捉动态性和复杂性的新的理论概念和框架。
数字孪生
在本文中,作者提出,通过在细胞层面上实现数字孪生,我们或许可以更好地理解和预测细胞的行为。通过整合结构、形态、组学及生化实验的数据,研究者将能够构建包含亚细胞片段的三维模型,这些模型能够对不同细胞结构原件的复杂性和相互作用进行展示 (图3)。在这一基础上,在虚拟空间中,细胞的行为及其对外部扰动的相应均可以进一步被模拟。此外,数字卵生可以包含不同层次上的复杂性,这些数字孪生将通过数据集、计算模拟和机器学习方法进行综合,以便更好地理解和发现细胞内现象,而数字孪生的预测结果可以用于指导下一步的实验设计或用于设计新的合成生物学方法。
图3.产生亚细胞区段数字孪生的流程示意
高度可信的结构模型
在构建数字孪生的过程中,关键的第一步就是整合多种不同的技术手段,如对NMR和SAXS或对X射线晶体学和cryo-EM进行整合,这些方法可以提供不同层次的信息,有助于构建更全面的结构模型。此外,AlphaFold在蛋白三维构象预测方面的成功,以及AI结构预测使得我们能够更准确地预测蛋白质的结构,为数字孪生的构建提供了重要的基础。数字孪生模型需要多层次和多构象的考虑,未来需要不断完善和扩展整合数据,而这些都是需要面临的挑战。数字孪生模型的建立是一个持续发展的过程,需要不断整合新的技术和数据,以更准确地反映细胞结构和功能。
分子动力学模拟
分子动力学模拟基于描述原子间相互作用的物理和化学规律,通过模拟所有原子之间的作用力,并利用高性能超级计算机来数值求解牛顿第二定律,从而预测生物分子的动力学,可以帮助表征单个蛋白质的原子级分辨率,估计膜的自由能成本等重要生物物理参数,并提供机械假设 (图4)。然而,分子动力学模拟也存在局限性,如力场的准确性、时间尺度的限制以及对细胞内亚结构的高保真模拟等问题。分子动力学模拟结果与实验数据的结合是十分重要的。在未来,增强分子动力学模拟与利用实验数据训练的机器学习方法相结合,并整合物理模拟与数据驱动方法,将为数字孪生的建立提供重要的支持。
图4. 复杂生物系统的分子动力学模拟
未来的结构生物学研究可能会通过准确量化空间内的细胞内容、测量细胞内的分子活动,并在虚拟现实中模拟细胞行为,以进行实验可验证的预测,并产生新的合成生物学手段。这些方法的综合力量具有巨大潜力,可以阐明复杂细胞自组织的基本规律。我们何时能够理解细胞如何工作?幸运的是,将会有大量的工作等待未来几代生物学家,他们将使用尚未被发明的方法来研究细胞。然而,一旦细胞的数字孪生能够对其行为进行,一个重要的里程碑就诞生了。
供稿 | 王彤彤
责编 | 囡囡
设计 / 排版 | 可洲 王婧曈
微信号:FRCBS-THU
因扫码入群人员已满,可扫码添加中心官方微信号,管理员邀请入群
原文链接
https://doi.org/10.1016/j.cell.2023.12.017
精彩回顾
精彩回顾
特别提示
微信公众号又双叒叕更改推送机制了,不是星标的订阅号,收到推送内容的时间会有延迟,甚至根本无法收到最新推送!不想错过FRCBS最新资讯,快来设为星标吧!
方法超简单,只需3秒钟!
点击上方卡片
关注我们吧
THE END
我知道你“在看”哟